Model Selection

Document Image Classification

# Document Image Classification

Dit Base Finetuned Rvlcdip Finetuned Data200

This model is a fine-tuned version of microsoft/dit-base-finetuned-rvlcdip on an image folder dataset, primarily used for image classification tasks.

Image Classification

Finetuned Vit Image Text Classifier

An image classification model based on the ViT architecture, designed to identify whether an image contains text and the type of text (Latin, Chinese, Arabic)

Image Classification

Dit Base Finetuned Brs

An image classification model fine-tuned based on microsoft/dit-base, performing well on the image folder dataset

Image Classification

Donut Base Finetuned Rvlcdip

Donut is an OCR-free document understanding Transformer model that combines a visual encoder and text decoder to process document images.

Dit Large Finetuned Rvlcdip

Document image classification model pretrained on IIT-CDIP and fine-tuned on RVL-CDIP, using Transformer architecture

Image Classification

Dit Base Finetuned Rvlcdip

DiT is a Transformer-based document image classification model, pretrained on the IIT-CDIP dataset and fine-tuned on the RVL-CDIP dataset

Image Classification

Featured Recommended AI Models

AIbase

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

© 2025AIbase